Chức năng World_Wide_Web

Bài chi tiết: HTTPHTML
World Wide Web hoạt động như một giao thức lớp ứng dụng được chạy "trên đỉnh" (theo nghĩa bóng) Internet, giúp làm cho nó hoạt động nhiều hơn. Sự ra đời của trình duyệt web Mosaic đã giúp web trở nên tiện dụng hơn rất nhiều, bao gồm hiển thị hình ảnh và hình ảnh chuyển động (GIF).

Các thuật ngữ Internet và World Wide Web thường được sử dụng mà không có nhiều sự khác biệt. Tuy nhiên, hai thuật ngữ không có nghĩa giống nhau. Internet là một hệ thống toàn cầu của các mạng máy tính được kết nối với nhau. Ngược lại, World Wide Web là một tập hợp toàn cầu các tài liệu và các tài nguyên khác, được liên kết bởi các siêu liên kết và URI. Tài nguyên web được truy cập bằng HTTP hoặc HTTPS, là các giao thức Internet cấp ứng dụng sử dụng các giao thức truyền tải của Internet.[36]

Việc xem một trang web trên World Wide Web thường bắt đầu bằng cách nhập URL của trang vào trình duyệt web hoặc bằng cách theo một siêu liên kết đến trang hoặc tài nguyên đó. Trình duyệt web sau đó khởi tạo một loạt các thông báo truyền thông nền để tìm nạp và hiển thị trang được yêu cầu. Vào những năm 1990, sử dụng trình duyệt để xem các trang web, và chuyển từ trang này sang trang khác thông qua các siêu liên kết, được biết đến như là 'duyệt web,' 'lướt web' (sau khi lướt kênh) hoặc 'điều hướng Web'. Những nghiên cứu ban đầu về hành vi mới này đã điều tra các mẫu người dùng trong việc sử dụng trình duyệt web. Một nghiên cứu, ví dụ, đã tìm thấy năm mẫu người dùng: lướt web khám phá, lướt web cửa sổ, lướt phát triển, điều hướng giới hạn và điều hướng mục tiêu.[37]

Ví dụ sau đây cho thấy chức năng của trình duyệt web khi truy cập một trang tại URL http://www.example.org/home.html. Trình duyệt phân giải tên máy chủ của URL (www.example.org) thành địa chỉ Giao thức Internet bằng Hệ thống tên miền (DNS) được phân phối toàn cầu. Tra cứu này trả về một địa chỉ IP như 203.0.113.4 hoặc 2001: db8: 2e:: 7334. Trình duyệt sau đó yêu cầu tài nguyên bằng cách gửi yêu cầu HTTP qua Internet đến máy tính tại địa chỉ đó. Nó yêu cầu dịch vụ từ một số cổng TCP cụ thể nổi tiếng với dịch vụ HTTP, để máy chủ nhận có thể phân biệt yêu cầu HTTP với các giao thức mạng khác mà nó có thể đang phục vụ. Giao thức HTTP thường sử dụng số cổng 80 và đối với giao thức HTTPS, thông thường nó là số cổng 443. Nội dung của yêu cầu HTTP có thể đơn giản như hai dòng văn bản:

GET /home.html HTTP/1.1Host: www.example.org

Máy tính nhận yêu cầu HTTP chuyển nó đến phần mềm máy chủ web lắng nghe yêu cầu trên cổng 80. Nếu máy chủ web có thể thực hiện yêu cầu, nó sẽ gửi phản hồi HTTP trở lại trình duyệt cho thấy thành công:

HTTP/1.1 200 OKContent-Type: text/html; charset=UTF-8

tiếp theo là nội dung của trang được yêu cầu. Ngôn ngữ đánh dấu siêu văn bản (HTML) cho một trang web cơ bản có thể trông như thế này:

<html>  <head>    <title>www.Example.org – The World Wide Web</title>  </head>  <body>    <p>The World Wide Web, abbreviated as WWW and commonly known ...</p>  </body></html>

Trình duyệt web phân tích cú pháp HTML và diễn giải đánh dấu (<title>, <p> cho đoạn văn,v.v...) bao quanh các từ để định dạng văn bản trên màn hình. Nhiều trang web sử dụng HTML để tham chiếu các URL của các tài nguyên khác như hình ảnh, phương tiện được nhúng khác, tập lệnh ảnh hưởng đến hành vi của trang và Biểu định kiểu xếp chồng ảnh hưởng đến bố cục trang. Trình duyệt thực hiện các yêu cầu HTTP bổ sung cho máy chủ web cho các loại phương tiện Internet khác. Khi nhận được nội dung của họ từ máy chủ web, trình duyệt sẽ dần dần hiển thị trang lên màn hình theo quy định của HTML và các tài nguyên bổ sung này.

HTML

Bài chi tiết: HTML

Ngôn ngữ đánh dấu siêu văn bản (HTML) là ngôn ngữ đánh dấu tiêu chuẩn để tạo các trang webứng dụng web. Với Cascading Style Sheets (CSS) và JavaScript, nó tạo thành một bộ ba công nghệ nền tảng cho World Wide Web.[38]

Trình duyệt web nhận tài liệu HTML từ máy chủ web hoặc từ bộ nhớ cục bộ và hiển thị tài liệu vào các trang web đa phương tiện. HTML mô tả cấu trúc của một trang web về mặt ngữ nghĩa và ban đầu bao gồm các tín hiệu cho sự xuất hiện của tài liệu.

Các phần tử HTML là các khối xây dựng của các trang HTML. Với cấu trúc HTML, hình ảnh và các đối tượng khác như biểu mẫu tương tác có thể được nhúng vào trang được hiển thị. HTML cung cấp một phương tiện để tạo các tài liệu có cấu trúc bằng cách biểu thị ngữ nghĩa cấu trúc cho văn bản như tiêu đề, đoạn văn, danh sách, liên kết, trích dẫn và các mục khác. Các phần tử HTML được mô tả bằng các thẻ, được viết bằng dấu ngoặc nhọn. Các thẻ như <img /><input /> trực tiếp giới thiệu nội dung vào trang. Các thẻ khác, chẳng hạn như <p> bao quanh và cung cấp thông tin về văn bản tài liệu và có thể bao gồm các thẻ khác làm thành phần phụ. Các trình duyệt không hiển thị các thẻ HTML, nhưng sử dụng chúng để diễn giải nội dung của trang.

HTML có thể nhúng các chương trình được viết bằng ngôn ngữ script như JavaScript, ảnh hưởng đến hành vi và nội dung của các trang web. Bao gồm CSS xác định giao diện và bố cục nội dung. World Wide Web Consortium (W3C), người duy trì cả hai tiêu chuẩn HTML và CSS, đã khuyến khích sử dụng CSS trên HTML trình bày rõ ràng.Tính đến năm 1997[cập nhật][39]

Liên kết

Hầu hết các trang web chứa siêu liên kết đến các trang liên quan khác và có lẽ các tệp có thể tải xuống, tài liệu nguồn, định nghĩa và các tài nguyên web khác. Trong HTML cơ bản, một siêu liên kết trông như thế này: <a href="http://www.example.org/home.html">www.Example.org Homepage</a>

Biểu diễn đồ họa của một phần nhỏ của WWW, thể hiện các siêu liên kết

Một tập hợp các tài nguyên hữu ích, có liên quan, được kết nối với nhau thông qua các liên kết siêu văn bản được mệnh danh là một mạng lưới thông tin. Xuất bản trên Internet tạo ra thứ mà Tim Berners-Lee gọi là WorldWideWeb (trong CamelCase ban đầu, sau đó đã bị loại bỏ) vào tháng 11 năm 1990.[13]

Cấu trúc siêu liên kết của WWW được mô tả bởi webgraph: các nút của biểu đồ web tương ứng với các trang web (hoặc URL) các cạnh được định hướng giữa chúng với các siêu liên kết. Theo thời gian, nhiều tài nguyên web được chỉ ra bởi các siêu liên kết biến mất, di dời hoặc được thay thế bằng các nội dung khác nhau. Điều này làm cho các siêu liên kết trở nên lỗi thời, một hiện tượng được gọi trong một số vòng tròn là thối liên kết và các siêu liên kết bị ảnh hưởng bởi nó thường được gọi là liên kết chết. Bản chất bất ổn của Web đã thúc đẩy nhiều nỗ lực lưu trữ các trang web. Internet Archive, hoạt động từ năm 1996, được biết đến nhiều nhất với những nỗ lực như vậy.

Tiền tố WWW

Nhiều tên máy chủ được sử dụng cho World Wide Web bắt đầu bằng www vì thông lệ đặt tên máy chủ Internet lâu dài theo các dịch vụ mà chúng cung cấp. Tên máy chủ của máy chủ web thường là www, giống như cách mà nó có thể là ftp cho máy chủ FTP và tin tức hoặc nntp cho máy chủ tin tức Usenet. Các tên máy chủ này xuất hiện dưới dạng Hệ thống tên miền (DNS) hoặc tên miền phụ, như trong www.example.com. Việc sử dụng www không được yêu cầu bởi bất kỳ tiêu chuẩn kỹ thuật hoặc chính sách nào và nhiều trang web không sử dụng nó; máy chủ web đầu tiên là nxoc01.cern.ch.[40] Theo Paolo Palazzi,[41] người từng làm việc tại CERN cùng với Tim Berners-Lee, việc sử dụng phổ biến www làm tên miền phụ là tình cờ; trang dự án World Wide Web dự định được xuất bản tại www.cern.ch trong khi info.cern.ch được dự định là trang chủ của Cern, tuy nhiên các bản ghi DNS không bao giờ được chuyển đổi và việc thực hành trả trước www vào trang web của tổ chức tên miền sau đó đã được sao chép. Nhiều trang web được thiết lập vẫn sử dụng tiền tố hoặc họ sử dụng các tên miền phụ khác như www2, an toàn hoặc en cho các mục đích đặc biệt. Nhiều máy chủ web như vậy được thiết lập sao cho cả tên miền chính (ví dụ: example.com) và tên miền phụ www (ví dụ: www.example.com) đề cập đến cùng một trang web; những người khác yêu cầu một hình thức này hoặc hình thức khác, hoặc họ có thể ánh xạ đến các trang web khác nhau. Việc sử dụng tên miền phụ rất hữu ích để tải cân bằng lưu lượng truy cập web đến bằng cách tạo bản ghi CNAME trỏ đến một cụm máy chủ web. Vì hiện tại, chỉ có một tên miền phụ có thể được sử dụng trong CNAME, kết quả tương tự không thể đạt được bằng cách sử dụng mở tên miền gốc.[42]

Khi người dùng gửi một tên miền chưa hoàn chỉnh cho trình duyệt web trong nhập thanh địa chỉ đầu vào của nó, một số trình duyệt web sẽ tự động thử thêm tiền tố "www" vào đầu của nó và có thể là ".com", ".org" và ".net "Ở cuối, tùy thuộc vào những gì có thể thiếu. Ví dụ: nhập ' microsoft ' có thể được chuyển đổi thành http://www.microsoft.com/ và 'openoffice' thành http://www.openoffice.org. Tính năng này bắt đầu xuất hiện trong các phiên bản đầu tiên của Firefox, khi nó vẫn có tiêu đề hoạt động 'Firebird' vào đầu năm 2003, từ một thực tiễn trước đó trong các trình duyệt như Lynx.[43] ] Có thông tin rằng Microsoft đã được cấp bằng sáng chế của Hoa Kỳ cho ý tưởng tương tự vào năm 2008, nhưng chỉ dành cho thiết bị di động.[44]

Trong tiếng Anh, www thường được đọc là double-u double-u double-u.[45] Một số người dùng phát âm nó dub-dub-dub, đặc biệt là ở New Zealand. Stephen Fry, trong loạt podcast "Podgrams" của mình, phát âm nó là wuh wuh wuh.[46] Nhà văn người Anh Douglas Adams đã từng châm biếm trong tờ Độc lập vào Chủ nhật (1999): "World Wide Web là điều duy nhất tôi biết về hình thức rút gọn của nó mất nhiều thời gian hơn ba lần để nói ngắn hơn"[47] Trong tiếng Quan Thoại, World Wide Web thường được dịch qua liên kết ngữ nghĩa thành Wan wǎng Wei (万维网), thỏa mãn www và nghĩa đen là "mạng vô số chiều",[48] một bản dịch phản ánh khái niệm thiết kế và phổ biến của World Wide Web. Không gian web của Tim Berners-Lee tuyên bố rằng World Wide Web được chính thức đánh vần là ba từ riêng biệt, mỗi từ viết hoa, không có dấu gạch ngang.[49] Việc sử dụng tiền tố www đã giảm dần, đặc biệt là khi các ứng dụng web Web 2.0 tìm cách tạo thương hiệu cho tên miền của chúng và làm cho chúng dễ phát âm.[50] Khi Web di động ngày càng phổ biến, các dịch vụ như Gmail.com, Outlook.com, Myspace.com, Facebook.com và Twitter.com thường được đề cập nhất mà không cần thêm "www." (hoặc, thực sự, ".com") cho tên miền.

Sơ đồ mô tả

Các chỉ định lược đồ http://https:// khi bắt đầu URI web tương ứng với Giao thức truyền siêu văn bản hoặc Bảo mật HTTP. Họ chỉ định giao thức truyền thông để sử dụng cho yêu cầu và phản hồi. Giao thức HTTP là nền tảng cho hoạt động của World Wide Web và lớp mã hóa được thêm vào trong HTTPS là điều cần thiết khi trình duyệt gửi hoặc truy xuất dữ liệu bí mật, như mật khẩu hoặc thông tin ngân hàng. Các trình duyệt web thường tự động thêm http: // vào các URI do người dùng nhập, nếu bị bỏ qua.

Trang web

Ảnh chụp màn hình của một trang web trên Wikimedia Commons

Một trang web (cũng được viết dưới dạng trang web) là một tài liệu phù hợp với World Wide Web và các trình duyệt web. Trình duyệt web hiển thị một trang web trên màn hình hoặc thiết bị di động.

Thuật ngữ trang web thường đề cập đến những gì có thể nhìn thấy, nhưng cũng có thể đề cập đến nội dung của chính tệp máy tính, thường là tệp văn bản chứa siêu văn bản được viết bằng HTML hoặc ngôn ngữ đánh dấu so sánh. Các trang web điển hình cung cấp siêu văn bản để duyệt đến các trang web khác thông qua các siêu liên kết, thường được gọi là các liên kết. Các trình duyệt web sẽ thường xuyên phải truy cập nhiều yếu tố tài nguyên web, chẳng hạn như đọc biểu định kiểu, tập lệnh và hình ảnh, trong khi trình bày từng trang web.

Trên mạng, trình duyệt web có thể truy xuất trang web từ máy chủ web từ xa. Máy chủ web có thể hạn chế quyền truy cập vào một mạng riêng như mạng nội bộ của công ty. Trình duyệt web sử dụng Giao thức truyền siêu văn bản (HTTP) để thực hiện các yêu cầu như vậy đến máy chủ web.

Một trang web tĩnh được phân phối chính xác như được lưu trữ, như nội dung web trong hệ thống tệp của máy chủ web. Ngược lại, một trang web động được tạo bởi một ứng dụng web, thường được điều khiển bởi phần mềm phía máy chủ. Các trang web động giúp trình duyệt (máy khách) cải thiện trang web thông qua đầu vào của người dùng đến máy chủ.

Trang web tĩnh

Trang web tĩnh (đôi khi được gọi là trang phẳng / trang cố định) là trang web được phân phối cho người dùng chính xác như được lưu trữ, trái ngược với các trang web động được tạo bởi ứng dụng web.

Do đó, một trang web tĩnh hiển thị cùng một thông tin cho tất cả người dùng, từ mọi bối cảnh, tùy thuộc vào khả năng hiện đại của máy chủ web để đàm phán loại nội dung hoặc ngôn ngữ của tài liệu có sẵn các phiên bản đó và máy chủ được cấu hình để làm như vậy.

Trang web động

Trang web động: ví dụ về scripting tại máy chủ (PHPMySQL).

Trang web động phía máy chủ là trang web có cấu trúc được điều khiển bởi máy chủ ứng dụng xử lý các tập lệnh phía máy chủ. Trong kịch bản phía máy chủ, các tham số xác định cách tiến hành lắp ráp mỗi trang web mới, bao gồm cả việc thiết lập xử lý phía máy khách nhiều hơn.

Một trang web động phía máy khách xử lý trang web bằng cách sử dụng tập lệnh HTML chạy trong trình duyệt khi tải. JavaScript và các ngôn ngữ kịch bản lệnh khác xác định cách HTML trong trang nhận được được phân tích cú pháp vào Mô hình đối tượng tài liệu hoặc DOM, đại diện cho trang web được tải. Các kỹ thuật phía máy khách tương tự sau đó có thể tự động cập nhật hoặc thay đổi DOM theo cùng một cách.

Sau đó, một trang web động được tải lại bởi người dùng hoặc bởi một chương trình máy tính để thay đổi một số nội dung biến. Thông tin cập nhật có thể đến từ máy chủ hoặc từ các thay đổi được thực hiện cho DOM của trang đó. Điều này có thể hoặc không thể cắt bớt lịch sử duyệt web hoặc tạo một phiên bản đã lưu để quay lại, nhưng một bản cập nhật trang web động bằng công nghệ Ajax sẽ không tạo ra một trang để quay lại, cũng không cắt bớt lịch sử duyệt web về phía trước của trang được hiển thị. Sử dụng các công nghệ Ajax, người dùng cuối sẽ có một trang động được quản lý dưới dạng một trang trong trình duyệt web trong khi nội dung web thực tế được hiển thị trên trang đó có thể khác nhau. Máy Ajax định vị trên trình duyệt yêu cầu các bộ phận DOM của nó, DOM, cho khách hàng của mình từ một máy chủ ứng dụng.

DHTML là thuật ngữ chung cho các công nghệ và phương pháp được sử dụng để tạo các trang web không phải là trang web tĩnh, mặc dù nó đã không được sử dụng phổ biến kể từ khi phổ biến AJAX, một thuật ngữ mà hiện nay nó hiếm khi được sử dụng. Kịch bản phía máy khách, kịch bản phía máy chủ hoặc kết hợp những thứ này tạo nên trải nghiệm web động trong trình duyệt.

JavaScriptngôn ngữ kịch bản được phát triển lần đầu tiên vào năm 1995 bởi Brendan Eich, sau đó là Netscape, để sử dụng trong các trang web.[51] Phiên bản tiêu chuẩn là ECMAScript.[51] Để làm cho các trang web tương tác nhiều hơn, một số ứng dụng web cũng sử dụng các kỹ thuật JavaScript như Ajax (JavaScript không đồng bộ và XML). Tập lệnh phía máy khách được phân phối cùng với trang có thể thực hiện các yêu cầu HTTP bổ sung cho máy chủ, để đáp ứng với các hành động của người dùng như di chuyển chuột hoặc nhấp chuột hoặc dựa trên thời gian đã trôi qua. Phản hồi của máy chủ được sử dụng để sửa đổi trang hiện tại thay vì tạo một trang mới với mỗi phản hồi, do đó máy chủ chỉ cần cung cấp thông tin gia tăng, giới hạn. Nhiều yêu cầu Ajax có thể được xử lý cùng một lúc và người dùng có thể tương tác với trang trong khi dữ liệu được truy xuất. Các trang web cũng có thể thường xuyên thăm dò máy chủ để kiểm tra xem thông tin mới có sẵn hay không.[52]

Trang web

Bài chi tiết: Trang web
Trang web usap.gov

Trang web [53] là tập hợp các tài nguyên web liên quan bao gồm các trang web, nội dung đa phương tiện, thường được xác định bằng một tên miền chung và được xuất bản trên ít nhất một máy chủ web. Ví dụ đáng chú ý là wikipedia.org, google.com và amazon.com.

Một trang web có thể được truy cập thông qua mạng Giao thức Internet (IP) công cộng, chẳng hạn như Internet hoặc mạng cục bộ riêng (LAN), bằng cách tham chiếu một trình định vị tài nguyên thống nhất (URL) xác định trang web.

Trang web có thể có nhiều chức năng và có thể được sử dụng trong nhiều thời trang khác nhau; một trang web có thể là một trang web cá nhân, một trang web công ty cho một công ty, một trang web của chính phủ, một trang web của tổ chức,v.v... Các trang web thường dành riêng cho một chủ đề hoặc mục đích cụ thể, từ giải trí và mạng xã hội đến cung cấp tin tức và giáo dục. Tất cả các trang web có thể truy cập công khai cùng nhau tạo thành World Wide Web, trong khi các trang web riêng, chẳng hạn như trang web của công ty dành cho nhân viên, thường là một phần của mạng nội bộ.

Các trang web, là các khối xây dựng của trang web, là các tài liệu, thường được soạn thảo bằng văn bản thuần túy xen kẽ với các hướng dẫn định dạng của Ngôn ngữ đánh dấu siêu văn bản (HTML, XHTML). Họ có thể kết hợp các yếu tố từ các trang web khác với các neo đánh dấu phù hợp. Các trang web được truy cập và vận chuyển với Giao thức truyền siêu văn bản (HTTP), có thể tùy chọn sử dụng mã hóa (HTTP Secure, HTTPS) để cung cấp bảo mật và quyền riêng tư cho người dùng. Ứng dụng của người dùng, thường là trình duyệt web, hiển thị nội dung trang theo hướng dẫn đánh dấu HTML của nó lên thiết bị đầu cuối hiển thị.

Siêu liên kết giữa các trang web chuyển đến người đọc cấu trúc trang web và hướng dẫn điều hướng của trang web, thường bắt đầu bằng một trang chủ chứa một thư mục của nội dung trang web. Một số trang web yêu cầu đăng ký người dùng hoặc đăng ký để truy cập nội dung. Ví dụ về các trang web đăng ký bao gồm nhiều trang web kinh doanh, trang web tin tức, trang web tạp chí học thuật, trang web trò chơi, trang web chia sẻ tệp, bảng tin, email dựa trên web, trang web mạng xã hội, trang web cung cấp dữ liệu thị trường chứng khoán theo thời gian thực, cũng như các trang web cung cấp dịch vụ khác nhau. Người dùng cuối có thể truy cập các trang web trên một loạt thiết bị, bao gồm máy tính để bànmáy tính xách tay, máy tính bảng, điện thoại thông minh và TV thông minh.

Trình duyệt web

Bài chi tiết: Trình duyệt web

Trình duyệt web (thường được gọi là trình duyệt) là tác nhân người dùng phần mềm để truy cập thông tin trên World Wide Web. Để kết nối với máy chủ của trang web và hiển thị các trang của nó, người dùng cần phải có chương trình trình duyệt web. Đây là chương trình mà người dùng chạy để tải xuống, định dạng và hiển thị một trang web trên máy tính của người dùng.[54]

Ngoài việc cho phép người dùng tìm, hiển thị và di chuyển giữa các trang web, trình duyệt web thường sẽ có các tính năng như giữ dấu trang, ghi lịch sử, quản lý cookie (xem bên dưới) và trang chủ và có thể có phương tiện để ghi lại mật khẩu để đăng nhập vào trang web.

Các trình duyệt phổ biến nhất là Chrome, Firefox, Safari, Internet ExplorerEdge.

Máy chủ web

Mặt trong và mặt trước của máy chủ web Dell PowerEdge, một máy tính được thiết kế để gắn giá đỡ

Máy chủ Web là phần mềm máy chủ hoặc phần cứng dành riêng để chạy phần mềm nói trên, có thể đáp ứng các yêu cầu máy khách World Wide Web. Nói chung, một máy chủ web có thể chứa một hoặc nhiều trang web. Một máy chủ web xử lý các yêu cầu mạng đến qua HTTP và một số giao thức liên quan khác.[55]

Chức năng chính của máy chủ web là lưu trữ, xử lý và phân phối các trang web cho người truy cập.[56] Giao tiếp giữa máy khách và máy chủ diễn ra bằng Giao thức truyền siêu văn bản (HTTP). Các trang được phân phối thường xuyên nhất là các tài liệu HTML, có thể bao gồm hình ảnh, biểu định kiểu và tập lệnh ngoài nội dung văn bản.

Nhiều máy chủ web có thể được sử dụng cho một trang web lưu lượng truy cập cao; Tại đây, các máy chủ Dell được cài đặt cùng nhau đang được sử dụng cho Wikimedia Foundation.

Tác nhân người dùng, thường là trình duyệt web hoặc trình thu thập dữ liệu web, bắt đầu giao tiếp bằng cách yêu cầu một tài nguyên cụ thể bằng HTTP và máy chủ phản hồi với nội dung của tài nguyên đó hoặc thông báo lỗi nếu không thể thực hiện được. Tài nguyên thường là một tệp thực trên bộ lưu trữ thứ cấp của máy chủ, nhưng điều này không nhất thiết phải như vậy và phụ thuộc vào cách máy chủ web được triển khai.

Mặc dù chức năng chính là phục vụ nội dung, nhưng việc triển khai HTTP đầy đủ cũng bao gồm các cách nhận nội dung từ khách hàng. Tính năng này được sử dụng để gửi biểu mẫu web, bao gồm việc tải lên tập tin.

Nhiều máy chủ web chung cũng hỗ trợ tập lệnh phía máy chủ bằng Active Server Pages (ASP), PHP (Bộ xử lý siêu văn bản) hoặc các ngôn ngữ tập lệnh khác. Điều này có nghĩa là hành vi của máy chủ web có thể được viết thành kịch bản trong các tệp riêng biệt, trong khi phần mềm máy chủ thực tế vẫn không thay đổi. Thông thường, chức năng này được sử dụng để tạo các tài liệu HTML một cách linh hoạt ("đang hoạt động") thay vì trả lại các tài liệu tĩnh. Cái trước chủ yếu được sử dụng để lấy hoặc sửa đổi thông tin từ cơ sở dữ liệu. Cái sau thường nhanh hơn nhiều và dễ dàng lưu vào bộ nhớ cache hơn nhưng không thể cung cấp nội dung động.

Máy chủ web cũng có thể thường xuyên được tìm thấy được nhúng trong các thiết bị như máy in, bộ định tuyến, webcam và chỉ phục vụ một mạng cục bộ. Sau đó, máy chủ web có thể được sử dụng như một phần của hệ thống để theo dõi hoặc quản trị thiết bị được đề cập. Điều này thường có nghĩa là không có phần mềm bổ sung nào phải được cài đặt trên máy khách vì chỉ cần một trình duyệt web (hiện đã có trong hầu hết các hệ điều hành).

Cookie web

Cookie HTTP (còn được gọi là cookie web, Internet cookie, cookie trình duyệt hoặc đơn giản là cookie) là một phần nhỏ dữ liệu được gửi từ một trang web và được trình duyệt web của người dùng lưu trữ trên máy tính của người dùng trong khi người dùng đang duyệt. Cookies được thiết kế để trở thành một cơ chế đáng tin cậy để các trang web ghi nhớ thông tin trạng thái (như các mục được thêm vào giỏ hàng trong cửa hàng trực tuyến) hoặc để ghi lại hoạt động duyệt của người dùng (bao gồm nhấp vào nút cụ thể, đăng nhập hoặc ghi lại trang nào đã được truy cập trong quá khứ). Chúng cũng có thể được sử dụng để ghi nhớ các mẩu thông tin tùy ý mà người dùng trước đây đã nhập vào các trường mẫu như tên, địa chỉ, mật khẩu và số thẻ tín dụng.

Các loại cookie khác thực hiện các chức năng thiết yếu trong web hiện đại. Có lẽ quan trọng nhất, cookie xác thực là phương pháp phổ biến nhất được sử dụng bởi các máy chủ web để biết liệu người dùng có đăng nhập hay không và họ đăng nhập vào tài khoản nào. Nếu không có cơ chế như vậy, trang web sẽ không biết nên gửi một trang có chứa thông tin nhạy cảm hay yêu cầu người dùng tự xác thực bằng cách đăng nhập. Tính bảo mật của cookie xác thực thường phụ thuộc vào bảo mật của trang web phát hành và trình duyệt web của người dùng và vào việc dữ liệu cookie có được mã hóa hay không. Các lỗ hổng bảo mật có thể cho phép hacker đọc dữ liệu của cookie, được sử dụng để có quyền truy cập vào dữ liệu người dùng hoặc được sử dụng để có quyền truy cập (với thông tin xác thực của người dùng) vào trang web có cookie (xem kịch bản chéo và chéo trang trang web yêu cầu giả mạo).[57]

Cookie theo dõi, và đặc biệt là cookie theo dõi của bên thứ ba, thường được sử dụng làm cách để lập hồ sơ dài hạn về lịch sử duyệt web của cá nhân – mối lo ngại về quyền riêng tư khiến Châu Âu[58] và các nhà lập pháp Hoa Kỳ phải hành động vào năm 2011.[59][60] Luật pháp châu Âu yêu cầu tất cả các trang web nhắm mục tiêu đến các quốc gia thành viên Liên minh châu Âu phải có được "sự đồng ý" từ người dùng trước khi lưu trữ cookie không cần thiết trên thiết bị của họ.

Nhà nghiên cứu của Google Project Zero, Jann Horn mô tả cách các cookie có thể được đọc bởi một bên trung gian, như nhà cung cấp điểm truy cập Wi-Fi. Ông khuyến nghị sử dụng trình duyệt ở chế độ ẩn danh trong những trường hợp như vậy.[61]

Công cụ tìm kiếm

Kết quả tìm kiếm cụm từ "nguyệt thực" trong công cụ tìm kiếm hình ảnh dựa trên web

Công cụ tìm kiếm web hoặc công cụ tìm kiếm Internet là một hệ thống phần mềm được thiết kế để thực hiện tìm kiếm trên web (tìm kiếm Internet), có nghĩa là tìm kiếm World Wide Web theo cách có hệ thống để biết thông tin cụ thể được chỉ định trong truy vấn tìm kiếm trên web. Các kết quả tìm kiếm thường được trình bày trong một dòng kết quả, thường được gọi là các trang kết quả của công cụ tìm kiếm (SERPs). Thông tin có thể là một hỗn hợp của các trang web, hình ảnh, video, infographics, bài viết, tài liệu nghiên cứu và các loại tệp khác. Một số công cụ tìm kiếm cũng khai thác dữ liệu có sẵn trong cơ sở dữ liệu hoặc thư mục mở. Không giống như các thư mục web, được duy trì bởi các biên tập viên của con người, các công cụ tìm kiếm cũng duy trì thông tin theo thời gian thực bằng cách chạy một thuật toán trên trình thu thập dữ liệu web. Nội dung Internet không có khả năng được tìm kiếm bởi một công cụ tìm kiếm web thường được mô tả là Web chìm.

Deep web

Bài chi tiết: Web chìm

Web chìm,[62] web vô hình,[63] hoặc web ẩn[64] là một phần của World Wide Web có nội dung không được lập chỉ mục bởi các công cụ tìm kiếm web tiêu chuẩn. Thuật ngữ ngược lại với web sâu là web bề mặt, có thể truy cập được đối với bất kỳ ai sử dụng Internet.[65] Nhà khoa học máy tính Michael K. Bergman được cho là đã đặt ra thuật ngữ deep web vào năm 2001 như một thuật ngữ lập chỉ mục tìm kiếm.[66]

Nội dung của web sâu được ẩn đằng sau các biểu mẫu HTTP,[67][68] và bao gồm nhiều cách sử dụng rất phổ biến như thư trên web, ngân hàng trực tuyến và các dịch vụ mà người dùng phải trả tiền và được bảo vệ bởi một Paywall, video theo yêu cầu, một số tạp chí và báo trực tuyến, trong số những loại khác.

Nội dung của web sâu có thể được định vị và truy cập bằng một địa chỉ URL hoặc IP trực tiếp và có thể yêu cầu mật khẩu hoặc quyền truy cập bảo mật khác qua trang web công cộng.

Tài liệu tham khảo

WikiPedia: World_Wide_Web http://computerworld.com.au/article/255293/-z_prog... http://home.cern/topics/birth-web http://info.cern.ch/ http://info.cern.ch/NextBrowser.html http://info.cern.ch/hypertext/WWW/TheProject.html http://musiclub.web.cern.ch/MusiClub/bands/cernett... http://tenyears-www.web.cern.ch/tenyears-www/Welco... http://soft-shake.ch/2011/en/conference/sessions.h... http://adage.com/article/digital/sen-rockefeller-r... http://googleblog.blogspot.com/2008/05/moving-to-u...